بهبود کارایی دسته بندی متن بر مبنای ویژگیها و متون دسته بندی شده مشابه

پایان نامه
چکیده

در یادگیری ماشین، داده های آموزشی نقش مهمی را در تعیین کارایی الگوریتم یادگیری ایفا می کنند. تعداد این داده های آموزشی در طول زمان افزایش می یابد وداده های جدیدی از راه می رسد. این داده های جدید، ممکن است دید جدیدی از داده های قبلی را ارائه دهند یا توزیع آماری داده ها را تغییر دهند. از این رو، فهمیدن اهمیت داده های جدید و اجازه به این داده ها، برای نقش داشتن در آموزش، به منظور افزایش کارایی سیستم یادگیر، کاری بس زیرکانه است. آموزش دوباره ی سیستم یادگیر با همه ی داده ها، و کنار گذاشتن همه ی تجربه ی یادگیری گذشته، یکی از راه حل ها برای این مسئله است ولی این روش دارای نقص هایی می باشد ازجمله اینکه این روش نا کارآمد است و همچنین، این روش قادر به نگه داری دانش قبلی نمی باشد. در این پایان نامه، ما چهار روش ارائه نمودیم. در روش اول، ما سیستم یادگیری افزایشی برای دسته بندی متن ارائه نمودیم، که در این سیستم، برای هر دسته ی آموزشی از یک دسته بند ماشین بردار پشتیبان برای یادگیری آن استفاده نمودیم و سپس، برای دسته بند بعدی علاوه بر دسته ی آموزشی آن دسته، از بردارهای پشتیبان دسته های آموزشی قبلی به اضافه ی داده های غلط دسته بندی شده ی مجموعه های تصدیق دسته های آموزشی قبلی استفاده نمودیم. در روش دوم برای اینکه بتوانیم میزان معیارهای ارزیابی کارایی را افزایش و خطای دسته بندی را کاهش دهیم به جای استفاده از تنها یک دسته بند برای هر دسته ی آموزشی، از چند دسته بند برای هر دسته ی آموزشی استفاده نمودیم و همچنین، به جای در نظر گرفتن وزن یکسان به هر دسته بند برای تاثیر در ترکیب خروجی ها، از روش اول پایان نامه ی آقای علی دانش استفاده نمودیم که ایشان به ازای ترکیب هر دسته و دسته بند از وزن مستقلی استفاده نموده اند. در روش سوم، به منظور کامل کردن روش قبلی، برای هر دسته ی آموزشی از میان مجموعه ی دسته بندها، چندین دسته بند قابل قبول را انتخاب نمودیم هدف از ارائه این روش کنارگذاشتن دسته بندهای ضعیف و جایگزین کردن آنها با دسته بندهای قویی بود که با داده های آموزشی بیشتری آموزش دیده بودند بود که این امر اشاره به قابلیت خود تطبیقی سیستم پیشنهادی دارد. در روش چهارم با بسط روش سوم در هنگام گرفتن خروجی نهایی، نودهای ایجاد کننده ی نویز را حذف و نودهایی، برای افزایش کارایی دسته بندی اضافه نمودیم. عملکرد روش های پیشنهادی با پنج روش دیگر مقایسه شد. نتایج آزمایشات، کارایی روش های پیشنهادی و بهبود کارایی دسته بندی متن را نشان می دهد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بهبود ویژگیها و دسته بندی کننده به منظور افزایش کارایی تشخیص هویت بر مبنای تصاویر شبکیه

در این پایان نامه، روشهایی سریع و در عین حال موثر برای تعیین مرکز دیسک نوری در تصاویر شبکیه و نیز شناسایی هویت بر اساس ویژگیهای استخراج شده از تصاویر شبکیه ارائه شده است. برای مکانیابی دیسک نوری الگوریتمهای متنوعی تاکنون ارائه شده است ولی در اکثر آنها با مشکلاتی نظیر زمان اجرای زیاد به دلیل انجام عملیات پیش پردازش (بخش بندی و جداسازی رگها) و ناکارآمدی آنها در صورت وجود بیماری (لکه های پاتولوژیک...

15 صفحه اول

دسته بندی برخی از خطاهای باصره رنگی

در این بررسی نسبت به دسته بندی برخی از خطاهای باصره رنگی بر اساس آن نوع از پدیده های شناخته شده علم فیزیک رنگ همچون پدیده های پایداری رنگی ، پدیده تلفیق و تباین رنگ ها و سایر موارد که می توانند نحوه ایجاد این گونه خطاهای باصره در انسان را توجیه کنند اقدام شده است

متن کامل

دسته بندی و شناسائی اهداف زیرآبی بر اساس اصوات منتشره

This paper investigates an underwater noise target classification algorithm in order to identify vessels in shallow water. To this aim the Hilbert Huang transform has been used to extract features in order to be used in a classifier. The Support Vector Machine has been considered to identify targets. The proposed method based on Hilbert Huang Transform shows considerable gain against similar ap...

متن کامل

افزایش کارائی دسته بندی متون بر اساس بهبود روش انتخاب خصیصه

در دسته بندی متون معمولا از کلمات به عنوان خصیصه استفاده می شود. از آنجا که در هر مجموعه متون، تعداد بسیار زیادی خصیصه وجود دارد، در این مقاله روش هائی به منظور کاهش تعداد خصیصه ها و انتخاب خصیصه های مرتبط، پیشنهاد شده است. به طور کلی روش های فیلتری انتخاب خصیصه از چهار همبستگی مثبت و منفی بین خصیصه های سندها و دسته ها در ضابطه انتخاب خصیصه استفاده می کنند. در روش های پیشنهادی این مقاله ابتدا ک...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023